Search CORE

31 research outputs found

A magyar beszédben előforduló mássalhangzó-kapcsolódások rezgésképének és akusztikai szerkezetének kutatása, rendszerezett leírása = Research of the acoustic structure of Hungarian consonant clusters in speech

Author: Olaszy Gábor
Publication venue: OTKA
Publication date: 01/01/2007
Field of study

A magyar hangtani kutatásokból hiányzik a mássalhangzó kapcsolódások akusztikai szerkezetének bemutatása. A kutatással elérni kívánt cél: ismerjük meg a mássalhangzó kapcsolódások akusztikai szerkezetét, tudjuk meg, hogy mely akusztikai paraméterek a legfontosabbak a mássalhangzó kapcsolódásokban a folyamatos beszéd korrekt felépítése szempontjából. Az akusztikai jelből visszakövetkeztethetünk az artikulációra. Itt arra vagyunk kíváncsiak, hogy milyenek a mozgássorozati elemek a mássalhangzó kapcsolódásban, mely mozgáselemek egyszerűsödnek, illetve melyek nem változnak a mássalhangzó hagyományos, például intervokális helyzetű képzéséhez viszonyítva. A vizsgálatokat két-, három-, négy- és ötelemű mássalhangzó kapcsolatokra végeztük. A várható eredmény: összefoglaló leírás a magyar mássalhangzó kapcsolódások akusztikai szerkezetéről. Az eredményeket oktatási anyag formájában az Interneten is hozzáférhetővé tesszük. | There are no data about the acoustic structure of consonant clusters in Hungarian speech. The aim of this research is to get more knowledge about the acoustic specialities of these speech building elements and to determine the invariant acoustic parameters. It is also possible to derive the articulation movements from the acoustic parameters, so the articulation of these consonant clusters can be studied as well. The following clusters are investigated: CC, CCC, CCCC, CCCCC. The result is a study about the Hungarian consonant clusters in speech. The book is to be published in Hungarian in 2007. Besides this the results can be studied ont he Internet at the home page: http://fonetika.nytud.hu/cccc . This interactive speech database serves as a good tool for education and research as well

Repository of the Academy's Library

Predicting Hungarian sound durations for continuous speech

Author: Olaszy Gábor
Publication venue: 'Akademiai Kiado Zrt.'
Publication date: 01/01/2002
Field of study

Direct measurements show that a number of factors influence the final value of sound durations in continuous speech. On the segmental level it is mainly the articulatory movements that determine important influence factors, while on the suprasegmental level accent, syllabic stress, within-word position, the preceding and following syllables and finallyutterance position may have an influence on final sound durations. So the problem of how to predict sound durations can be described with a multivariable function in which the effect of the variables cannot be easily defined with good accuracy. It is difficult to separate the effects of certain functions, i.e., it is difficult to model this function, making direct measurements on the speech signal. A model has been constructed and realized in which three well-defined levels are working separately. In the first one (this is the segmental level) the separation of the effect of articulation from other factors is solved. The second and third levels relate to the suprasegmental level of speech

Repository of the Academy's Library

The most important prosodic patterns of Hungarian

Author: Olaszy Gábor
Publication venue: 'Akademiai Kiado Zrt.'
Publication date: 01/01/2002
Field of study

Prosody is a general term for the following features in speech: pitch and intonation, stress, articulation rate, sound intensity and time structure (rhythm and pauses). During verbal communication various prosodic forms contribute to the expression of the content of the message (the information carried by the text, emotional expression, to imitate a situation etc.). So, prosody can be represented as a multivariable function in which the number of variables is rather high. Therefore it is difficult to describe the complex process for all situations, meanings, and emotions. In this paper we try to give a phonetic level characterization of pitch and intonation structure and also the function of intensity in time of the main Hungarian sentence types (using a unified description). The manner of description is new concerning Hungarian. It is based on a unified relative scale in which not physical values but relative distances in pitch values and intensity are used to characterize the melody forms and the intensity levels. This description allows for the representation of these two prosodic elements independently of the personal features (mean F0 value, the range of the F0 of the speaker, etc.). The representation makes it possible to express the crossfunctions among the melody forms of different expressions. This means that complete prosodic patterns can be predicted for any text without an acoustic analysis

Repository of the Academy's Library

Fonetikai algoritmus a hanghatárok gépi meghatározásának javítására nagyméretű beszédadatbázisokban

Author: Olaszy Gábor
Publication venue
Publication date: 01/01/2007
Field of study

A beszédtechnológiai kutatásokhoz és gyakorlati alkalmazásokhoz egyre nagyobb méretű beszédadatbázisokat terveznek. Ezek egyik fajtája, amikor előre meghatározott szöveg felolvasásával hozzák létre a több órányi beszédanyagot. Ilyen adatbázis például a BME TMIT időjárás jelentéseket tartalmazó beszédkorpusza, amelyik 5400 mondatot tartalmaz. Ahhoz, hogy gépi módszerekkel lehessen ezt a hanganyagot a későbbiekben feldolgozni (szavakat, hangkapcsolatokat keresni stb.), a szöveget át kell írni hangszintű szimbólumsorozattá, majd jelölni kell a hanghullámon a hangokat, azok határát, a szavak kezdetét, a szüneteket, valamint szinkronba kell hozni a szöveget a hangzó formával automatikus gépi felismerés segítéségével. Az így jelölt hangok és hanghatárok csak mintegy 95%-os pontossággal adnak kellően helyes eredményt. Ez azonban nem elegendő a jó minőségű, korpusz alapú beszédszintézishez. Ebben a tanulmányban egy olyan utófeldolgozó algoritmust ismertetünk, amelyikkel növelni lehet a pontosságot, ezzel a szintézis minőségét

University of Szeged

Interaktív formánsérték-módosító fejlesztése

Author: Abari Kálmán
Olaszy Gábor
Publication venue
Publication date: 01/01/2011
Field of study

A cikkben bemutatjuk egy webalapú interaktív formánsértékmódosító program felépítését és használatát. Az alkalmazás kötött szerkezetben várja a kiinduló formánsértékeket, melyeket egy Flash-ben készült program segítségével tudunk kényelmesen módosítani, azaz hozzáigazítani a hangszínképhez. A kiindulási és módosított értékeket is MySQL adatbázisban tároljuk, melyek fel- és letöltésrl külön funkció gondoskodik. A formánsmódosítás során használt hangszínkép megjelenítéséhez a WAV formátumú hangfájlok feltöltése is szükséges. A fejlesztést a magyar formánsadatbázis készítése és továbbfejlesztése ihlette

University of Szeged

Magyar hangsúly-adatbázis az interneten kutatáshoz és oktatáshoz

Author: Abari Kálmán
Olaszy Gábor
Publication venue
Publication date: 01/01/2014
Field of study

Hangsúlyadatbázis eddig nem készült magyar nyelvre. Beszédtechnológiai kutatásokban és az oktatásban is nagy igény lenne egy referenciaként használható, helyes hangsúlycímkéket tartalmazó mondatgyjteményre. Fejlesztésünkkel ezt a hiányt kívántuk pótolni. A webes lekérdezfelülettel rendelkez hangsúlyadatbázisunk 1869 kijelent mondatot tartalmaz, amelyekben minden szó hangsúlypozícióját megjelöltük. A honlapon számos szempont alapján kereshetünk és a találati lista is több formában (szöveges, kép és hang) jeleníthet meg. A vizsgált magyar mondatok hangsúlymintázatainak gyakorisága is lekérdezhet. A honlap a http://magyarbeszed.tmit.bme.hu/hangsuly címen érhet el

University of Szeged

Internetes beszédadatbázis a magyar mássalhangzó-kapcsolódások akusztikai szerkezetének bemutatására

Author: Abari Kálmán
Olaszy Gábor
Publication venue
Publication date: 01/01/2006
Field of study

University of Szeged

Az első magyar nyilvános, internetes beszédadatbázis bemutatása

Author: Abari Kálmán
Olaszy Gábor
Publication venue
Publication date: 01/01/2007
Field of study

University of Szeged

Kísérlet automatizált szövegelemzési módszerek kialakítására a szóhangsúlyok meghatározásához

Author: Olaszy Gábor
Tamm Anne
Publication venue
Publication date: 01/01/2005
Field of study

Az automatikus szövegelemzés bonyolult kérdésköréből egy résztéma vizsgálatát tztük ki célul, nevezetesen a hangsúly-kategóriák szavankénti kijelölését meghatározott mondatokban. Az eredményeket a gépi beszédszintézis prozódiai támogatáshoz tervezzük felhasználni. A hangsúly-kategóriákat úgynevezett címkékkel jelöljük a szó előtt a szövegben. A célkitűzést két irányból közelítjük: A klasszikus módszernél a címkéket nyelvészeti mondatelemzés eredményéből nyerjük. A másik eljárás lényege nem nyelvészeti központú, hanem egyfajta egyszer felszíni szövegelemzés, melyben nem használunk nyelvészeti módszereket, csupán szólistákat, táblázatokat, egyszer szabályokat. Mindkét elemzési formánál alapkövetelmény az algoritmizálhatóság. Az elemzésekhez ugyanazokat a hangsúly-kategóriákat használjuk, így mód nyílik arra, hogy közvetlenül összehasonlíthassuk a nyelvészeti elemzés eredményét a nem nyelvészeti központú eljárásból kapott hangsúly jelölésekkel. Rávilágítunk mindkét elemzésnél, hogy mely problémák miatt nem kaphatunk teljes érték eredményt sok esetben

University of Szeged

REALIS 1.1

Author: Dóla Mónika
Nőthig László
Olaszy Gábor
Publication venue
Publication date: 01/01/2014
Field of study

A laptopos bemutatásra szánt eALIS1.1 program elssorban nyelvészek (mint „bels felhasználók”) számára hivatott eszköztárat adni olyan nyelvfragmentumok építésére, amelyek jól ragadják meg a természetes nyelvek sajátosságait, elssorban a kompozicionális jelentésösszegzdést. A definiálható jelentések olyan pragmatikai-szemantikai leírások, amelyek megfelelnek a (reprezentacionalista dinamikus diskurzusszemantikák családjába tartozó) eALIS releváns definícióinak. A felépített nyelvet alkalmazókat küls felhasználóként határozhatjuk meg. Lényegében egy sajátosan megsokszorozott adatbázist kapnak, ami a való világ modellje mellett annak alternatíváit is felkínálja. A eALIS alapállása szerint ezek a formális szemantikából ismerhet „lehetséges világok” mindig odaköthetek a világmodellben jelen lév humán ágensekhez mint azok (tév-) hiedelmei, vágyai, szándékai, álmai. A küls felhasználó a program használata során (lépésrl lépésre) lexikai egységeket kap választásra, ezekbl mondatokat építhet, a felépített mondatoknak pedig megkapja az igazságértékelését egy általa kiválasztott vagy feltöltött világmodell alapján. Az igazságértékelést olyan „konstruktivista” módon kib- vítve értjük, hogy a program az „igaz” válaszon túl megadja mindazt az információt, ami alátámasztja e választ. Nemcsak a nyelvleírás „próbára tételét” szolgálhatja tehát a program, hanem adatgyjtésre és -rendszerezésre is használható

University of Szeged